package com.xwj.aiforrag.utils;

public class TextStringUtils {
    public static String removeEmptyLines(String text) {
        // 使用正则表达式分割文本，考虑各种换行符组合
        String[] lines = text.split("\r\n|\r|\n");
        StringBuilder result = new StringBuilder();
        for (String line : lines) {
            // 只有当行非空时才保留
            if (!line.trim().isEmpty()) {
                result.append(line).append("");
            }
        }
        // 移除最后添加的多余换行符
        if (result.length() > 0) {
            result.setLength(result.length() - 1);
        }

        // 移除 HTML 标签（简单正则，对于复杂HTML建议使用Jsoup）
        String cleanText = result.toString().replaceAll("<[^>]*>", "");

        // 将多个连续空格压缩为一个
        cleanText = cleanText.replaceAll("\\s+", "");
        cleanText = cleanText.replaceAll("------------", "");

        // 移除首尾空格
        cleanText = cleanText.trim();

        return cleanText;

    }
}
